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1 Introduction 

Les systèmes informatisés relatifs à des matériaux documentaires ethnogra- 
phiques recueillis sur le terrain présentent habituellement deux défauts. 

Le premier concerne la mise en relation de matériaux de typologie différente. Une 
recherche sur le terrain, en effet, produit généralement un ensemble de matériaux 
documentaires hétérogènes pour ce qui est de leur support physique (on peut avoir 
des documents sonores sur bande magnétique, des photographies, des films, etc.) et 
néanmoins étroitement liés. Très souvent, cependant, on est en présence de systèmes 
qui travaillent de manière séparée sur des matériaux sonores, des extraits de films, 
des photographies, des éditions verbales ou musicales, etc. sans donner à l’utilisateur 
aucune possibilité de mettre en relation les données. 

Le deuxième défaut est l’absence d’instruments de base destinés à l’analyse, à la 
comparaison des données ainsi qu’à des recherches fondées sur des mécanismes de 
4 Query Expansion ’, c’est à dire des recherches étayées par des bases de connaissances 
déjà structurées. Dans les archives ethnographiques, en effet, on tend à considérer 
l’ordinateur non pas comme un moyen pour traiter, examiner et rechercher de façon 
plus ou moins détaillée les informations, mais simplement comme un moyen pour 
publier des données. 

Les systèmes informatiques utilisés à présent par AESS, c’est-à-dire 1’ ‘Archivio 
di Etnografia e Storia Sociale’ [Archive d’Ethnographie et d’Histoire Sociale] 1 , pré- 
sentent au moins partiellement ces mêmes défauts. D’où la décision de promouvoir 
des projets concernant la mise au point d’environnements expérimentaux de tra- 
vail : ces environnements de travail ont des objectifs généraux, comme la possibilité 
d’introduire et de consulter des matériaux par un réseau à longue distance (par 
exemple Internet) ; ils visent en outre à supporter aussi bien une intégration étroite 
des matériaux disponibles dans les différents supports et des dispositifs destinés à 
différents types d’analyses et de repérage des informations. 

Un de ces environnments expérimentaux est le système que nous illustrerons à 
grands traits dans cet article, et dont le nom est Als-H (‘Ambiente di lavoro spe- 
rimentale basato su Hyper- G /Hyper Wave’ [Environnement expérimental de travail 
basé sur Hyper-G/HyperWave]). 

Cet article sera divisé en trois parties. Dans la première partie nous présenterons 
les traits principaux de Hyper-G/HyperWave, le système développé à l’Université 
de Graz et qui est sous tous les aspects le coeur de Als-H. Dans la deuxième partie 
nous décrirons brièvement quelques-uns des modules de Als-H qui permettent à 
un utilisateur d’effectuer des observations analytiques relatives à la base de données 
ethnographiques de AESS 2 . Dans la troisième partie, nous nous pencherons enfin 
sur l’intégration en Als-H d’une base de connaissance en mesure de permettre aux 
utilisateurs des recherches basées sur des mécanismes de Query Expansion. 

2 Quelques indications sur Hyper-G et Als-H 

Hyper-G/HyperWave (Andrews & Kappe 1994, Andrews et al. 1995, Kappe 
1995, Maurer 1996, Dalitz & Heyer 1995, 1996) est un système d’information hy- 
permédia structuré, multi-utilisateur et multiprotocole qui peut fonctionner comme 
une base de données répartie, et qui a été développé à l’Tnstitute for Information 

1. Actuellement, AESS est subdivisé en deux sous- archives distinctes : ACO (‘Archivi délia 
Comunicazione Orale’ [Archives de la Communication Orale]) et AIM (‘Archivi dell’Immagine’ 
[Archives de l’Image]). 

2. Cette base de données se compose actuellement d’environ mille heures d’enregistrements 
sonores, d’environ 500.000 images photographiques et d’un petit nombre de films en video VHS et 
16 millimètres. 
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Processing and Computer Supported New Media’ de la Graz University of Tech- 
nology (Autriche). Il s’agit moins d’un système totalement innovateur que d’une 
extension logique de World-Wide-Web et de Gopher — avec lesquels il conserve 
d’ailleurs une interopérabilité complète. 

Hyper- G /Hyper Wave gère une base de données qui est constituée par des ob- 
jets et par des relations entre ces objets. Les objets sont des instances de classes 
particulières de la sémantique donnée, et ils sont associés à un nombre variable 
d’attributs. Comme dans la programmation orientée objet, il est possible de dériver 
des classes plus spécifiques à partir de classes plus générales, en héritant de ces 
dernières, par cette dérivation, certaines caractéristiques comme, par exemple, la 
spécification de certains attributs. La figure 1 représente la hiérarchie des objets 
standard de Hyper- G /Hyper Wave. 

Sans entrer dans les détails, on peut faire quelques brèves considérations sur la 
hiérachie qui est représentée dans cette figure : 

i. Premièrement, il faut souligner que Hyper- G /Hyper Wave peut gérer une 
typologie très vaste de documents : des documents textuels, des documents 
sonores, des images fixes ou en mouvement, des scènes tridimensionnelles, des 
documents PostScript, des documents SQL tirés d’un SGBD (par exemple, 
Oracle), des documents distants (par exemple des documents Web) et aussi 
des ‘documents génériques’. Ces derniers peuvent être des documents de for- 
mat arbitraire — comme des fichiers MIDI encodant des informations musi- 
cales — ou bien des applet Java, du code écrit dans n’importe quel langage 
de programmation, ou encore des programmes exécutables, etc. 

ii. Deuxièmement, à l’intérieur de la hiérarchie il faut observer la présence 
de la classe ‘ collection ’ et de ses sous-classes ‘ cluster ’ (‘grappe’) et ‘sé- 
quence’ (‘séquence’). En utilisant les instances de la classe ‘collection’, Hyper- 
G/HyperWave permet la structuration des informations. Dans Hyper-G/Hy- 
perWave, en effet, de même que dans les langages orientées objets comme 
Smalltalk, C++ ou Objective-C, une collection est un objet composite à dé- 
finition récursive, et qui en l’occurrence peut contenir un nombre indéfini de 
documents et d’autres collections. Dans Hyper- G /Hyper Wave, une hiérarchie 
de collections ou de documents est soumise à deux restrictions particulières : 

a. Chaque document ou collection doit faire partie au moins d’une autre 
entité (c’est à dire l’entité-père) à l’unique exception de l’entité située à 
la racine de la hiérarchie. 

b. Chaque document ou collection — à l’unique exception de l’entité située 
à la racine de la hiérarchie — peut être membre d’un nombre indéfini de 
documents ou de collections ; la hiérarchie n’est donc pas un simple arbre, 
mais un graphe direct acy clique permettant des regroupements, des oppo- 
sitions et des distinctions même extrêmement détaillées des informations. 

Quant aux sous-classes ‘grappe’ et ‘séquence’, elles redéfinissent partiellement 
la notion de collection. Une ‘grappe de documents’ est un document com- 
posite contenant d’autres documents qui peuvent être traités dans Hyper- 
G/HyperWave comme un document logique singulier. Une ‘grappe de do- 
cuments’ peut par exemple être composée d’un document textuel et d’une 
image : au moment de leur visualisation, ces deux documents pourront être 
récupérés simultanément. Quant à la séquence, elle peut être définie comme 
un document composite qui organise en une succession linéaire ordonnée les 
éléments qu’elle contient. 

iii. Le traitement des liens par Hyper- G /Hyper Wave mérite une dernière consi- 
dération. Dans Hyper- G /Hyper Wave, les liens attachent une ancre source 
associée à une zone d’un document à une ancre de destination qui peut être 
associée à une zone à l’intérieur d’un autre document, à un document entier 
ou à une collection. Comme on peut le voir dans la figure 1, les ancres sont des 
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FIGURE 1 - Hiérarchie des objets standard de Hyper-G/HyperWave. 
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objets Hyper-G/HyperWave à part entière, et les liens ne sont pas physique- 
ment situés à l’intérieur des documents — comme dans World-Wide-Web — 
mais dans une base de données dédiée. Cela permet d’avoir, par rapport à 
World-Wide-Web, une série d’avantages : 

a. Il est possible d’avoir des liens associatifs bidirectionnels : non seulement, 
en effet, on peut arriver à un document en suivant le lien qui pointe vers 
lui ; on peut aussi, à partir de n’importe quel document d, récupérer tous 
les documents et toutes les collections qui, à leur tour, pointent sur d. 

b. Il est possible d’insérer des liens associatifs dans tout genre de documents, 
y compris dans les documents textuels, les images, les films et les scènes 
tridimesionnelles. 

c. Les liens ont des attributs, c’est-à-dire qu’ils sont étiquetages. 

d. Il est possible d’établir des liens concernant aussi des informations stockés 
sur des supports permettant la seule lecture des données (par ex. des 
disques WORM ou des CD-ROM). 

e. On élimine le problème de ce qu’on appelle les ‘liens déplacés’ (‘ dangling 
links ’) — un problème qui est très présent dans World-Wide-Web. En 
effet, dans World-Wide-Web, quand un document est éliminé ou déplacé, 
il n’y a pas moyen d’effacer ou de modifier les liens qui pointent sur ce do- 
cument. Dans Hyper-G/HyperWave, au contraire, l’intégrité référentielle 
est garantie et maintenue automatiquement par le serveur. Quand on éli- 
mine un document on élimine également tous les liens qui le concernent. 
Par contre, quand on déplace un document, les liens ‘suivent’ à leur tour 
le document en tenant compte du déplacement de ce dernier. 

2.1 Architecture client-serveur 

Nous allons maintenant observer l’architecture client- serveur de Hyper-G à par- 
tir du schéma représenté dans la figure 2. 



FIGURE 2 - Architecture client-serveur. 

Le schéma montre bien l’interoperabilité d’ Hyper- G /Hyper Wave avec des clients 
et des serveurs Web et Gopher. Quand, par exemple, un client Web (ex. Netscape 
Navigator, Internet Explorer) accède à un serveur Hyper-G/HyperWave, celui-ci 
convertit automatiquement chaque niveau de la hiérarchie des collections en un 
document HTML contenant un menu de liens qui pointent sur les membres de 
la collection. Les documents textuels d’ Hyper- G /Hyper Wave, y compris les liens, 
sont convertis au vol en documents HTML. Il faut aussi remarquer qu’un serveur 
Hyper-G/HyperWave peut stocker des pointeurs sur des objets distants situés sur 
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des serveurs Web ou Gopher. Cela permet d’incorporér facilement dans le système 
des informations résidentes sur des serveurs non Hyper- G /Hyper Wave ; les menus de 
Gopher sont transformés automatiquement en des collections Hyper- G /Hyper Wave, 
et les documents Web en des documents Hyper- G /Hyper Wave. 

Il faut finalement observer, dans la figure, la présence d’un moteur d’indexation 
intégré dans le système. Dans Hyper- G /Hyper Wave, les documents et les collections 
sont indexés automatiquement au moment de leur introduction dans la base de 
données ; ce système peut en outre supporter des recherches de type ‘flou’ (‘ fuzzy ’) ou 
des recherches basées sur les opérateurs booléens, aussi bien de type plein texte que 
concernant les seuls attributs. Ou encore, les recherches peuvent avoir un domaine 
d’application vaste ou limité, selon les decisions de l’utilisateur. Cela signifie que 
l’utilisateur peut limiter le domaine d’une recherche à une collection particulière 
(laquelle, à son tour, peut d’ailleurs être répartie sur plusieurs serveurs). 

2.2 La partie client (Unix/Xll) 

Après avoir donné ces renseignements sur les caractéristiques principales d’un 
système Hyper- G /Hyper Wave, on peut donc commencer à traiter la partie client 
du système. 

Comme on l’a déjà dit, tout client Web (par exemple, Netscape Navigator, In- 
ternet Explorer) peut accéder à un serveur Hyper- G /Hyper Wave. Toutefois, pour 
pouvoir exploiter toutes les caractéristiques innovatrices que supporte un serveur 
Hyper- G /Hyper Wave, il convient d’utiliser des clients natifs tels que Harmony, le 
client Hyper-G/HyperWave pour les plate-formes Unix/Xll qui est actuellement 
utilisé dans l’environnement Als-H (voir figure 3, qui représente une image écran 
typique de cet environnement de travail). 

Harmony est une application multiprocessus dans laquelle le ‘Session Manager’ 
(le ‘Gestionnaire de Session’) est le processus principal : il communique avec le 
serveur Hyper-G/HyperWave, il supporte différents instruments de navigation et 
d’interrogation, il coordonne toutes les autres activités et il active les processus 
secondaires (les ‘éditeurs des documents’) selon les opérations de sélection effectuées 
par l’utilisateur . 

La fenêtre du ‘Gestionnaire de Session’ (voir fig. 4) représente le contenu du 
système organisé en hiérachies de collections et de documents (par exemple des 
textes, des images, des sons, etc.). La figure 4 montre, en l’occurrence, différentes 
collections concernant les entités dérivées de la modélisation des données propre à 
Als-H, lequel, à son tour, reprend la modélisation propre au système InterTesto 3 . 

La fenêtre montre non seulement différentes collections fermées, mais aussi une 
collection ouverte concernant un ‘événement’, c’est-à-dire l’entité logique par la- 
quelle Als-H, tout comme InterTesto, organise les informations relatives à une 
enquête particulière sur le terrain. A l’intérieur de l’événement indiqué par le sigle 
‘Bogno 1994a’ (une interview réalisée dans le cadre de recherches sur la pêche pro- 
fessionnelle pratiquée dans un des lacs de la Lombardie, le Lac Majeur) ont été 
visualisées différentes sous-composantes, parmi lesquelles on peut distinguer cinq 
sous-composantes majeures : 

i. Les matériaux documentaires [‘materiali documentai’], ou plus exactement 
leur copie digitalisée et transférée sur un support magnétique ou optique. Ils 
se divisent en matériaux sonores, filmiques et photographiques, et ils sont 
en outre répartis selon des critères de continuité temporelle. En d’autres 
mots, les segments sonores sont identifiés selon les interruptions relevées sur 
le support d’origine, et les segments filmiques selon la présence de plans- 
séquences ; chaque segment photographique correspond à la même photo. 

3. InterTesto est un système développé en 1994 par l’auteur de cet article pour les ‘Archivi 
délia Comunicazione Orale’ de la Regione Lombardia; cf. Grazioli (1996a). 
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Als-H : image écran typique. 
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ii. La représentation structurale [‘rappresentazione strutturale’] de l’événement. 
Elle distingue, comme pour les matériaux documentaires, les segments de 
communication sonores, les plans-séquences et les photographies. Les seg- 
ments de communication sonores sont traités dans Als-H de la même façon 
que dans InterTesto. Si dans un segment on reconnaît des fragments so- 
nores qui peuvent être ramenés à un genre défini (récit autobiographique, par 
exemple, chant narratif, etc.), on active, dans ce même segment, des ‘docu- 
ments formalisés’ correspondant à ces fragments. Ces documents peuvent, à 
leur tour, maintenir avec d’autres documents différents types de relations (un 
document de genre x, par exemple, peut être enchâssé dans un document de 
genre y ; cf. Grazioli 1996a, 112-114). Par contre, tout ce qui à l’intérieur d’un 
segment de communication sonore ne peut pas être défini comme un ‘docu- 
ment formalisé’ reçoit des spécifications associées aux endroits du segments 
qui introduisent un thème donné. Ces spécifications s’articulent en ‘argu- 
ments’ et ‘sous-arguments’ (les ‘arguments’ signalent de vastes zones du dis- 
cours focalisées sur un seul thème, et les ‘sous- arguments’ sous-catégorisent 
des composantes particulières du développement du thème). Les spécifica- 
tions, en outre, sont des descriptions synthétiques libres (la fenêtre montre 
par exemple à son milieu les arguments ‘Tipi di rete : dal cotone al nylon’ 
[types de filets : du coton au nylon], ‘Orari di lavoro’ [heures de travail], 
etc.). La description structurale de l’événement est complétée par des infor- 
mations concernant ce qui est visualisé dans les plans-séquences et dans les 
photographies. 

iii. La troisème composante majeure concerne les matériaux complémentaires 
[‘materiali complementari’]. Il s’agit, en substance, de pointeurs sur des ob- 
jets contenus dans des collections spécifiques situées à un autre endroit de 
la base de données, ou bien placées dans des sites distants. D’habitude ces 
objets peuvent se révéler utiles pour un nombre indéfini d’événements, et 
généralement ils sont constitués par des représentations cartographiques, des 
scènes tridimensionnelles et des pointeurs sur des sites Web appropriés. Le 
laboratoire de l’Istituto Italiano di Idrobiologia [‘Institut Italien d’Hydrobio- 
logie’] du CNR de Verbania (voir fig. 4, en bas), par exemple, est un site 
approprié pour l’événement ‘Bogno 1994a’, qui traite des thèmes relatifs à 
la pêche professionnelle pratiqueée dans le Lac Majeur. Dans le serveur de 
cet institut sont conservées en effet de nombreuses informations, de genre 
différent, sur le lac, et aussi des informations et des images concernant les 
espèces des poissons d’eau douce vivant dans le territoire italien. 

iv. La quatrième sous-composante majeure concernant la représentation d’un 
événement est constituée par les éditions verbales et/ou musicales des seg- 
ments de communication sonores et des documents formalisés. Pour la ré- 
daction de ces éditions Als-H prévoit les mêmes modalités qu’InterTesto 
(Grazioli 1996a, 1996b). 

v. Le diagramme de V événement [‘mappa’] est la dernière sous-composante. Il 
s’agit d’une représentation générée de façon semi-automatique par un uti- 
litaire spécifique de Als-H, dans laquelle différents objets contenus dans 
l’événement se rangent selon l’axe temporel. Cette représentation — qui est, 
en substance, un diagramme de Gantt — signale des interrelations entre les 
objets contenus dans l’événement, et aussi des relations possibles de super- 
position et de co-occurrence. 

Harmony est doté d’éditeurs natifs de documents pour six types de média : des 
média textuels ou sonores, des fichiers PostScript, des scènes tridimensionnelles, des 
films et des images. Beaucoup d’éditeurs reconnaissent différents types de formats 
d’encodage. En outre, Harmony peut être configuré pour lancer des programmes 
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externes à la place des éditeurs natifs, ou pour les types de documents non supportés. 

Voici la liste des éditeurs d’Harmony : 

i. L’éditeur de textes (voir fig. 3, en haut à droite) montre aussi bien des do- 
cuments en format natif Hyper- G /Hyper Wave que des documents HTML. 
Dans le cadre de Als-H l’éditeur de textes est utilisé essentiellement à deux 
fins spécifiques : 

a. Pour montrer les fiches concernant les attributs standard d’un objet (une 
trentaine environ) prévues par Als-H (par exemple les supports d’en- 
registrement, les informateurs singuliers ou collectifs, les zones géogra- 
phiques de relevé des données, etc.). 

b. Pour montrer différents types d’éditions concernant le matériaux verbaux 
disponibles (Grazioli 1996a). L’éditeur de textes montre également les 
pages Web placées dans des sites distants, et qui peuvent devenir partie 
des matériaux complémentaires d’un événement. 

ii. L’éditeur de scènes tridimensionnelles (voir fig. 5) peut montrer des modèles 
tridimensionnels en format VRML. Le mode d’interaction par default avec 
l’éditeur permet de modifier la position du modèle et de le faire tourner sans 
que cela entraîne aucun changement de position de l’utilisateur. Il y a, par 
contre, quatre autres modes d’interaction qui demandent à l’utilisateur d’ef- 
fectuer des mouvements à l’intérieur du modèle. Les ancres source peuvent 
être définies par rapport à des parties arbitraires d’un modèle tridimension- 
nel. Les ancres de destination sont déterminées sur la base des positions de la 
caméra par rapport au modèle. En d’autres mots, elles figent le modèle avec 
un cadrage particulier qui est caractérisé par une position et une orientation 
données. 



FIGURE 5 - Éditeur de scènes tridimensionnelles. 

D’habitude, dans Als-H on utilise cet éditeur pour montrer des objets qui 
font partie des matériaux complémentaires d’un événement. La figure 5, par 
exemple, représente un modèle tridimensionnel schématique qui concerne 
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une section particulière du Lac Majeur. Les modèles tridimensionnels de 
ce genre non seulement suppléent le manque de matériaux documentaires 
visuels concernant un événement déterminé ; ils donnent aussi à l’utilisateur 
la possibilité de visualiser le cadre (les objets et l’environnement) dans lequel 
ont lieu les actions et les expériences rapportées au cours de l’événement. Et 
tout cela, en exploitant les avantages de l’interactivité. 

iii. L’éditeur des matériaux sonores supporte différents formats audio, selon sa 
propre configuration et selon la plate-forme sur laquelle on fait tourner Har- 
mony. 

Il est utilisé dans Als-H pour reproduire des matériaux documentaires so- 
nores, et il permet d’établir des liens entre les parties définies dans la descrip- 
tion structurale d’un événement (par exemple les documents, les arguments 
et les sous-arguments) et des points spécifiques du segment sonore. 

iv. L’éditeur PostScript montre des documents qui sont décrits en utilisant ce 
même langage. Dans les documents, les ancres sont représentées par des zones 
rectangulaires de la page. Les liens peuvent pointer sur des objets arbitraires. 
D’habitude, dans Als-H cet éditeur est utilisé pour faire référence à des 
documents de travail ou à des notes internes. 

v. L’éditeur d’images en mouvement (voir fig. 6) permet de montrer des vidéos 
en format MPEG. Les ancres peuvent être de forme elliptique, circulaire 
ou rectangulaire. Leur position peut être définie par rapport à des photo- 
grammes spécifiques, et les ancres source peuvent être activées même pendant 
la projection du film. 
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FIGURE 6 - Éditeur d’images en mouvement. 
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Dans Als-H cet éditeur n’a pas seulement la fonction — évidente d’ailleurs — 
de montrer les films contenus dans la base de données. Il peut être utilisé 
aussi à d’autres fins, en fonction de sa possibilité de supporter des ancres. 
Un utilisateur qui consulte des éditions peut par exemple (c’est la fonction la 
plus courante) en tirer des informations sur le développement de la situation 
dans laquelle le texte a été réalisé, ou bien il peut obtenir des informations 
concernant l’interdépendance entre la composante gestuelle et la composante 
vocale d’une performance. L’éditeur est aussi utilisé pour donner à l’utilisa- 
teur la possibilité d’effectuer des ‘lectures’ parallèles d’événements, en se 
servant des diagrammes temporels de ces derniers, 
v. L’éditeur des images (voir fig. 7) permet de montrer des images en différents 
formats standard. Les ancres source ou de destination peuvent avoir des 
formes rectangulaires, circulaires, elliptiques ou polygonales. 



FIGURE 7 - Éditeur des images. 

Dans Als-H l’éditeur des images est utilisé non seulement pour visualiser les 
photographies contenues dans la base de données, mais aussi pour montrer 
le diagramme temporel des événements, ainsi que différentes informations de 
type visuel associées aux documents : des transcriptions en ‘notation Laban’, 
par exemple, ou des schémas ou des dessins positionnant les participants à un 
événement. Il peut être également utilisé pour montrer des parcours effectuées 
par les participants pendant un événement tel qu’une procession, ou pour 
montrer des parcours évoqués verbalement au cours d’un événement, etc. 
Quant aux ancres, dans Als-H elles sont utilisées surtout comme référence 
pour les objets présents dans l’espace d’une interaction verbale. Il s’agit donc 
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d’objets auxquels les locuteurs peuvent se référer par deixis (Fillmore 1975, 
Anderson & Keenan 1985), c’est-à-dire des objets fondamentaux pour la 
compréhension de ce qui est exprimé dans les matériaux sonores disponibles. 
Quand on peut assigner à une image une localisation précise sur l’axe tempo- 
rel d’un événement, on introduit cette image dans le diagramme temporel de 
l’événement. Par contre, quand on ne peut pas, même partiellement, iden- 
tifier une position sur l’axe temporel, une photographie peut être associée 
exclusivement à la hiérarchie de l’événement. Cela n’empêche que ces photo- 
graphies, en l’absence de relations attestées avec le développement temporel 
d’un événement, peuvent entretenir des relations de type logique avec tout 
autre objet présent dans l’événement ou dans la base de données. 

Harmony possède en outre deux instruments de navigation concernant la base 
de données qui sont extrêmement puissants et flexibles. 

Le premier est un ‘plan local’ qui visualise des relations entre des objets (par 
exemple les documents textuels, les collections, les documents distants, les informa- 
tions internes à un type de document particulier, etc.). Le plan local de Harmony 
peut visualiser les relations effectuées arbitrairement par des liens associatifs ; il 
peut aussi visualiser des notes provisoires ou permanentes concernant les objets, et 
également les relations père-enfant établies à l’intérieur de la hiérarchie des collec- 
tions. Le plan peut être régénéré en fonction de la représentation de n’importe quel 
objet, et il fournit donc à l’utilisateur différentes façon de visualiser avec précision 
une zone particulière de la base de données. Il donne également à l’utilisateur la 
possibilité de ‘sauter’ d’un paquet d’informations à l’autre. 

Prenons par exemple la situation représentée dans le plan local de la figure 8a : 
dans cette figure l’objet luna crescente , qui est un document formalisé, est lié à 
des collections indiquant de différentes façons l’événement ‘Bogno 1994a’, auquel 
il appartient, et d’autres informations plus ou moins importantes pour sa mise en 
fiche, sa mise en archives et son catalogage. Etant donné cette situation, il est 
possible de sélectionner n’importe quel autre nœud contenu dans ce plan et de 
générer instantanément le réseau de relations que ce nœud entretient avec d’autres 
entités contenues dans la base de données. La figure 8b montre la représentation 
structurale de l’événement auquel le document luna crescente appartient, tandis que 
la figure 8c montre une nouvelle régénération du plan, effectuée en choisissant comme 
objet de référence un des nœuds contenus dans le plan local montré dans la figure 
8b, c’est-à-dire la fiche d’information (‘ scheda inf. : ) concernant la photo 0006296. 
En cliquant avec la souris sur un nœud, on active l’objet correspondant ; si cet objet 
est un document, il est montré grâce à l’éditeur approprié. Il faut aussi remarquer 
que, d’un point de vue opérationnel, le plan local entretient une interrelation étroite 
avec le Gestionnaire de Session (cf. fig. 4). Quand on sélectionne un objet dans le 
plan local, et que cet objet n’est pas déjà affiché dans la fenêtre du Gestionnaire 
de Session, ce dernier se reconfigure en ouvrant un chemin complet ayant comme 
élément terminal l’objet sélectionné. De cette façon, un utilisateur peut se rendre 
compte du contexte d’un objet avant de décider, éventuellement, de le visualiser, 
de l’écouter ou d’interagir avec lui. De même il est possible de sélectionner dans le 
Gestionnaire de Session n’importe quel objet, pour en générer ensuite le plan local. 
Un panneau de contrôle permet en outre de régler les caractéristiques du plan selon 
les désirs et les exigences immédiates de l’utilisateur : il est possible, par exemple, 
de spécifier le nombre et la typologie des liens qui doivent être visualisés ; il est 
possible de décider la longueur maximale du chemin en termes de nœuds traversés, 
etc. 

Le deuxième instrument est constitué par 1’ ‘Information Landscape’ (‘Paysage 
Informatif’ ; voir figures 9 et 10 ; cf. Eyl 1994 et Wolf 1996). 

Il s’agit d’une interface graphique tridimensionnelle qui génère automat ique- 
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FIGURE 9 - Paysage informatif. 
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ment un environnement dans lequel on peut naviguer, et où sont visualisés de façon 
compacte et intuitive les objets résidents dans le serveur, leurs attributs et leurs 
relations hiérarchiques et associatives. Les utilisateurs peuvent ‘survoler’ le pano- 
rama des informations en se déplaçant dans l’espace pour chercher les informations 
pertinentes. Ce type de représentation tridimensionnelle possède beaucoup de func- 
tionnalités qui reprennent celles du Gestionnaire de Session : les objets peuvent 
être sélectionnés et activés, les attributs peuvent être visualisés, on peut activer 
des documents à l’intérieur des éditeurs correspondants, on peut effectuer des re- 
cherches, etc. Les deux fenêtres, en outre, sont synchronisées, de façon à ce que les 
modifications apportées par l’utilisateur dans l’une d’elles se reflètent dans l’autre. 

Il y a encore une fenêtre qui est associée à ‘Information Landscape’ : il s’agit de 
‘OverView Map’, qui, selon les opérations effectuées par l’utilisateur dans la représen- 
tation spatiale des informations, génère une image bidimensionnelle des différentes 
collections qui sont montrées au fur et à mesure dans ‘Information Landscape’. Il 
faut finalement remarquer (voir fig. 10) que ‘Information Landscape’ non seulement 
visualise les relations père-fils entre les différents objets du système, mais peut éven- 
tuellement visualiser tous les liens existant entre ces objets : les liens en entrée sont 
montrés au-dessous de l’objet, et les liens en sortie au-dessus. 
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3 Instruments destinés à l’analyse 

Nous nous penchons maintenant sur les travaux qui sont actuellement en cours 
et qui visent à associer à la base de données gérée par Hyper- G /Hyper Wave des 
dispositifs destinés à l’analyse des matériaux. On peut dire qu’il y a deux directions 
de travail distinctes. 

3.1 Textes 

La première s’occupe de l’analyse automatique de certains types de textes, ap- 
pliquant des méthodologies propres à l’analyse computationnelle du discours. 

On sait que cette discipline a élaboré au cours de ces dernières années des notions 
et des instruments d’analyse extrêmement puissants et sophistiqués. Cependant, elle 
rencontre encore un nombre considérable d’obstacles. L’obstacle principal est peut- 
être posé par le fait qu’un dispositif interprétatif doit pouvoir disposer de bases de 
connaissances (aussi bien générales que liées à des secteurs spécifiques) très vastes 
et bien structurées, et qu’il lui est nécessaire d’invoquer des mécanismes inférentiels 
pour déduire ce qui, dans un texte, n’est pas explicitement dit ou pour sanctionner 
le caractère correct ou incorrect de certains résultats interprétatifs (par exemple, la 
justesse d’une solution concernant l’interprétation d’une anaphore pronominale). 

La nécessité de se baser massivement sur des connaissances diffuses et sur des 
processus inférentiels — qui se pose donc pour un dispositif interprétatif destiné à la 
compréhension du langage, mais qui en définitive rend très difficile une réalisation 
de niveau acceptable de ce même dispositif — se présente évidemment aussi pour les 
interviews, les conversations et la plupart des documents formalisés contenus dans 
la base de données AESS. Il y a par contre d’autres types particuliers de textes qui, 
tout en présentant qualques problèmes liés à l’utilisation de différents dialectes par 
les locuteurs, permettent d’élaborer des dispositifs analytiques relativement simples 
— au moins en ce qui concerne la gestion des connaissances nécessaires pour leur 
interprétation. 

Prenons comme exemple un type de texte parmi les plus fascinants de la tradi- 
tion orale européenne, c’est-à-dire ce qu’on appelle couramment, dans le domaine 
ethnographique et philologique, un ‘chant narratif’ ou une ‘ballade’. 

En général une ballade raconte, en quelques vers, une histoire 4 . Le cadre, les 
situations thématiques et les coordonnées générales de l’action apparaissent cepen- 
dant tellement pauvres et stéréotypés qu’on a parfois l’impression de n’avoir à faire 
qu’à une simple juxtaposition de prototypes et de situations ‘toutes prêtes’. Cette 
circonstance nous donne la possibilité de situer des objects textuels (des événements, 
des états de choses, des personnages, etc.) dans un domaine à haute conventionna- 
lité ; de plus, elle permet d’élaborer une série de schémas en mesure de supporter, en 
principe, un dispositif inteprétatif qui puisse, à partir d’une transcription, arriver à 
élaborer un modèle textuel contenant les éléments principaux d’une ballade. 

Pour plus de détails, les points suivants exposent brièvement les conditions prin- 
cipales qui peuvent faciliter l’interprétation automatique des textes des ballades 
contenus dans la base de données AESS : 

i. l’exiguïté extrême du lexique utilisé, et aussi l’attribution d’une signification 
univoque aux éléments lexicaux ; 

ii. la grande simplicité de la formulation syntactique des textes; on observe 
une utilisation plus fréquente de la parataxe et un emploi beaucoup plus 
limité des subordonnées (il s’agit dans la plupart des cas de subordonnées 
temporelles situées en début de strophe, de relatives et de consécutives) ; 

4. Pour les caractéristiques linguistiques des ballades de l’Italie du Nord voir Terracini (1914, 
1957), Nicco (1979), Grazioli (1995, 1996c). 
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iii. la tendance à contenir dans les limites de la strophe les différents moments de 
la narration : chaque strophe correspond généralement à un nouvel épisode 
ou à une phase successive du récit, et ce n’est que rarement que la division 
formelle en strophes ne suit pas la division au niveau du contenu ; en outre, 
les strophes coïncident, le plus souvent, avec des domaines textuels assimi- 
lables à ceux qu’on appelle généralement ‘segments de discours’ (‘ discourse 
segments’ ; cf. Webber 1988 et 1991, Nakatani et al. 1995, Grosz et al. 1995) ; 

iv. le nombre généralement très limité des personnages de l’histoire (de deux 
à quatre), l’attribution de traits très stéréotypés (le menteur, le prétendant, 
etc.) et la tendance à organiser les interactions verbales entre les personnages 
selon des couples de répliques correspondant à des schémas définis (demande- 
réponse, accusât ion-justificat ion, etc.) ; 

v. le caractère très stéréotypé des situations représentées (par exemple l’enlè- 
vement du personnage x par y , le conflit entre les personnages x et y , le 
meurtre de x par y, etc.) ; 

vi. l’absence d’histoires multiples ou parallèles dans le développement du texte ; 

vii. la présence de modules traditionnels du récit, selon un répertoire très limité 
et essentiellement de type formulaire (cf. Nicco 1979). 

Sans entrer dans les détails de l’organisation concrète du prototype qui, dans 
Als-H, est préposé à l’interprétation des textes des ballades (ce qui demanderait une 
exposition très longue et technique), il suffit de dire que ce système est actuellement 
en mesure d’élaborer avec une bonne approximation, pour un nombre limité de 
textes dialectaux de la zone du Piémont, un modèle textuel qui enregistre, entre 
autres, les éléments évoqués dans les textes (les événements, les états de choses, les 
individus, les déplacements de l’action dans l’espace, etc.), qu’ils soient mentionnés 
explicitement ou qu’on puisse les déduire par des processus inférentiels. 

On retrouve également dans Als-H un deuxième type d’instruments destinés à 
l’analyse, qui, par contre, visent essentiellement à extraire et à traiter des informa- 
tions déjà explicitement codées à l’intérieur des éditions. 

En ce qui concerne le domaine des éditions verbales, Als-H se sert d’une série 
d’outils élémentaires mais en mesure de donner à un utilisateur des informations 
précieuses. Il suffit de penser, par exemple, à des applications simples qui fournissent 
les concordances des formes linguistiques présentes dans toute la base de données 
ou dans un sous-ensemble, ou à des applications qui effectuent l’analyse des rimes, 
des assonances ou des anomalies des textes versifiés, ou encore qui cherchent à 
identifier automatiquement le genre d’un texte en se basant exclusivement sur ses 
traits formels ; on peut aussi mentionner, finalement, des applications qui fournissent 
des statistiques de différents types et itG, c’est-à-dire le visualisateur des graphes 
d’InterTesto et de Als-H (cf. fig. 11) 5 . 

5. itG est basé sur l’emploi d’algorithmes génétiques et/ou d’algorithmes standard pour le 
calcul du layout d’un graphe (Paulish 1993) et permet la visualisation des interconnexions existant 
entre différents objets — considérés comme objets élémentaires à différents niveaux d’abstraction — 
qui font partie de la base de données choisie (cf. Grazioli 1996a). L’extrême flexibilité de itG permet 
son utilisation dans de multiples domaines. Par exemple : i) visualisation des interconnexions 
entre des documents compris dans différentes séquences et/ou dans différentes hiérarchies (cf. 
§ 2) ; ii) visualisation des relations présentes à l’intérieur de la base de connaissance lexicale 
dont se sert Als-H (voir §4) ; iii) visualisation des interconnexions présentes dans les syntagmes 
verbaux ou musicaux basés sur ‘formules’ ; iv) visualisation des éventuelles connexions existant 
entre documents appartenant à des genres donnés sur la base de la présence des traits considérables 
(par exemple motifs ou ‘fonctions’ en ce qui concerne les genres narratifs) ; v) visualisation du 
réseau de rapports existant dans des segments de communication et / ou des événements sur la base 
d’éléments compris dans arguments et sous-arguments. En particulier, le graphe montré dans la 
figure 11 concerne un ensemble de documents qui remplissent trois conditions : a) être dans la 
séquence avec d’autres documents, b) appartenir au genre ‘comptine’, c) avoir été recueillis en 
Piémont, Lombardie, Trentin ou Vénétie. 
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FIGURE 11 - itG : le visualisateur des graphes d’InterTesto et de Als-H. 

3.2 Éditions musicales 

En ce qui concerne le domaine des enquêtes portant sur les éditions musi- 
cales, Als-H se sert de itT, une application basée sur le paradigme ‘ Model-View- 
Controller ’ (Leibs & Rubin 1991). 

itT ne possède pas de stratégies interprétatives autonomes, et, contrairement 
aux systèmes informatisés qui ont été développés pour la composition musicale al- 
gorithmique, il n’est pas doté d’un vaste bagage de connaissances musicales. Mais 
même s’il est caractérisé par la ‘cécité’ typique des simples manipulateurs informa- 
tiques de bas niveau, il peut de toute manière se révéler utile dans au moins trois 
domaines spécifiques d’application, où il peut être utilisé de façon indépendante ou 
en association avec d’autres composantes de Als-H. 

Premièrement, il peut être utilisé comme un système de recherche d’informa- 
tions musicales, en exécutant ainsi une tâche indispensable pour les archives de 
grandes dimensions et constituées en grande partie, comme AESS, par des maté- 
riaux sonores de chant. Une illustration typique de cet emploi particulier de itT 
est celle d’un utilisateur qui désire rechercher, à l’intérieur de la base de données 
constituée par les éditions musicales, un ou plusieurs documents ayant en commun 
des caractéristiques mélodiques, rythmiques ou harmoniques déterminées. Pour ce 
faire, il peut insérer dans la fenêtre appropriée de itT les caractéristiques du ‘motif’ 
recherché (en spécifiant par exemple une succession de hauteurs et de durées), ou 
il peut exécuter directement le motif en se servant d’un instrument MIDI connecté 
avec l’ordinateur. itT, à son tour, répond à cette demande en fournissant la liste 
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des documents dans lesquels le motif a été identifié. 

Mais un ‘motif’, ou tout autre modèle musical, peut être réalisé avec des trans- 
positions, des altérations, des variations, etc. A cause de ces écarts — qui d’ailleurs 
sont tout à fait normaux dans le cadre de la pratique d’exécution propre de la 
musique de tradition orale — il est plutôt rare que des modèles musicaux présents 
dans des documents différents coïncident parfaitement. D’où l’introduction, dans 
itT, d’un dispositif permettant de donner des réponses par approximation aux de- 
mandes formulées par l’utilisateur. 

Ce dispostif doit en substance quantifier et qualifier le degré de corrélation entre 
des objets musicaux qui tout en se ressemblant ne sont pas réellement les mêmes. 
Pour ce faire il utilise un système qui consiste à assigner des ‘poids’ aux différentes 
composantes de l’information recherchée, en établissant de cette façon un système 
de priorités. Ces ‘poids’, qui paramétrent et orientent la procédure de recherche, 
peuvent être explicitement définis par l’utilisateur, ou il peuvent être sélectionnés à 
l’intérieur d’un ensemble prédéfini et proposé directement par le système. 



FIGURE 12 - itT : image écran typique. 

Dans ces cas, l’ordinateur répond aux demandes de l’utilisateur en présentant un 
ensemble de documents. Ces documents contiennent des éléments ‘ressemblant’ sous 
certains aspects au modèle musical demandé. L’ensemble est ordonné en fonction 
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du degré de ressemblance avec le modèle donné en entrée. Le degré de ressemblance 
est calculé sur la base des poids assignés. 

La figure 12 montre le résultat d’une de ces recherches ‘approximatives’ réali- 
sables en se servant de itT. Le panneau en bas à droite présente quelques variantes 
d’un ‘motif’ particulier 6 . Comme on peut remarquer, les lignes mélodiques se res- 
semblent fortement mais elles ne sont pas identiques : la deuxième mesure de la 
première ligne montre, en l’occurrence, une croche (re) suivi de deux double croches 
( sol-fa ), tandis que la mesure correspondante de la deuxième ligne montre une noire 
(re). Ou encore, la troisième et la quatrième ligne mélodique de la troisième mesure 
montrent des groupes de quatre double croches ; mais la succession de la troisième 
ligne est do-re-do-si , tandis que la succession de la quatrième ligne est re- do- si- do , 
etc. 

Il faut, entre autres, tenir compte du fait qu’une ressemblance plus ou moins 
accentuée entre des modèles mélodiques, rythmiques et harmoniques peut être l’in- 
dice de rapports génétiques ou historiques entre des documents différents. Cette 
première utilisation de itT peut donc s’avérer extrêmement utile : non seulement 
elle donne à un utilisateur la possibilité de trouver rapidement l’information cher- 
chée (et, éventuellement, de l’écouter, sans se limiter à la voir affichée à l’écran) ; elle 
permet aussi d’identifier des familles de documents qui sous certains aspects sont 
reliés l’un à l’autre, et donc de fournir aux personnes chargées de la mise en fiche de 
ces documents des éléments supplémentaires qui peuvent être éventuellement utiles 
pour leur catalogage. 

Il faut ajouter au passage qu’on est en train d’expérimenter un module de itT 
permettant l’accès aux informations même à un utilisateur qui serait complètement 
ignorant en matière musicale. Dans ce module, la demande d’informations s’effectue 
simplement en faisant arriver à l’ordinateur, par un microphone, un modèle vocal 
de ces dernières. 

A l’intérieur de Als-H, itT a aussi un deuxième domaine d’application qui est 
plus étroitement relié à la réalisation d’enquêtes systématiques de type musicolo- 
gique. 

itT possède en effet des classes et des méthodes qui permettent d’effectuer 
un nombre considérable d’opérations analytiques de différent type, ce qui donne 
au chercheur la possibilité d’évaluer rapidement la validité d’hypothèses de tra- 
vail spécifiques. itT peut par exemple transformer, extraire, coordonner, classer, 
contextualiser, corréler, quantifier statistiquement ou traiter d’autres façons des in- 
formations musicales diverses ; il peut en outre donner des réponses à des questions 
visant à délimiter les horizons du fonctionnement d’un système musical spécifique. 
Dans Als-H, en outre, toutes les éditions musicales sont directement ou indirec- 
tement associées aux attributs standard prévues par le système : itT peut donc 
permettre à un chercheur de restreindre le domaine d’application des différents 
analyses possibles même à de simples sous-ensembles de toute la base de données 
disponible. En d’autres mots, un chercheur peut se constituer des bases de données 
temporaires par des opérations de sélection portant sur les différents attributs qui 
caractérisent les documents formalisés stockés dans le serveur (par exemple : genre, 
lieu, informateurs singuliers ou collectifs, schéma métrique, etc.). Ceci permet au 
chercheur d’effectuer des analyses comparatives et contrastives en se basant sur 
des ensembles de données sous certains aspects homogènes. Un chercheur peut par 
exemple comparer l’étendue ou la structure des échelles des documents de genre g 
rassemblés dans la zone géographique 2 ; il peut comparer la structuration formelle 
et le comportement mélodique, harmonique ou rythmique des documents appar- 
tenant aux répertoires de deux groupes d’informateurs différents, ou encore, après 

6. Le choix d’un motif très simple n’est dû qu’à une exigence de clarté ; cela ne signifie aucu- 
nement que itT n’est pas en mesure d’identifier des corrélations entre des motifs plus complexes. 
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avoir identifié dans la base de données les documents qui partagent des caractéris- 
tiques musicales spécifiques, un chercheur peut vérifier le genre d’appartenance de 
ces documents, les zones géographiques d’origine, les contextes d’utilisation, etc. 

En rendant disponible un ensemble de classes et de méthodes prédéfinis pour 
l’analyse musicologique, itT peut en outre être utilisé non comme une simple appli- 
cation fermée, mais comme un système ouvert de développement. En d’autres mots, 
il donne au chercheur la possibilité de construire rapidement des outils logiciel en 
mesure d’exécuter des tâches analytiques qui initialement n’étaient pas prévues par 
le système. 

Troisièmement, itT peut être utilisé pour la définition de règles explicites pour 
l’association texte-mélodie dans des répertoires particuliers. Dans le cadre des do- 
cuments de chant présents dans AESS, en effet, on retrouve des corrélations qui 
peuvent être traitées par des théories douées de capacités prédictives quant aux 
rapports qui canoniquement lient les syllabes, leur hiérarchie accentuelle, la struc- 
ture de la phrase musicale, etc. Le mécanisme utilisé par itT pour l’élaboration des 
règles d’association texte-mélodie est basé sur les solutions propres à la phonologie 
autosegmentale et à la phonologie prosodique (voir, entre autres, Goldsmith 1979, 
Liberman 1978, Nespor & Vogel 1986, Kenstowicz 1994) 7 . 

Pour finir, je voudrais faire une observation sur le type de représentation sous- 
jacente des informations qu’utilise itT. 

Dans le domaine de la musicologie assistée par ordinateur, le problème de la 
représentation des informations musicales a été et continue d’être très discuté. 
Contrairement à d’autres systèmes (voir par exemple Pope 1991, Pachet & As- 
sayag 1995), itT utilise pour la représentation un approche très simple, basé sur 
la solution utilisée dans un ensemble d’outils Unix développés par Huron (1996) 
— des outils avec lesquels itT conserve une compatibilité maximale. L’encodage 
des informations est effectué en premier lieu dans un tableau bidimensionnel. Les 
lignes de ce tableau, qui peuvent être considérées comme des représentations d’in- 
tervalles temporels, enregistrent les entités co-occurrentes, tandis que les colonnes 
enregistrent les entités ordonnées de façon séquentielle sur l’axe temporel. Les cases 
du tableau contiennent des chaines de caractères (éventuellement vides) qui ex- 
priment arbitrairement une signification relative à des ensembles d’informations de 
typologie uniforme. L’indication de la typologie des informations situées dans les 
cases est reprise dans l’en-tête de chaque colonne, et chaque colonne peut contenir 
tout type de représentation qui s’adapte à des contraintes de nature exclusivement 
syntactique. 

On se s’attardera pas sur le nombre d’avantages que ce type de représentation 
très abstraite de codage offre d’un point vue général. Il importe de souligner ici que le 
fait de pouvoir définir un nombre virtuellement illimité de schémas de représentation 
concernant des entités de nature arbitraire offre, dans le domaine de l’analyse de 
musiques de tradition orale, des avantages spécifiques. 

Premièrement, le haut degré d’abstraction de la représentation sous-jacente, qui 
a pour seule contrainte une formulation syntactique correcte, permet dans un cer- 
tain sens de reproduire la solution ‘ouverte’ utilisé aussi bien par InterTesto que 
par Als-H pour la rédaction des éditions des textes verbaux. Les informations mu- 
sicales peuvent en effet être codées en parallèle en utilisant aussi bien des schémas 
de représentation à contenu informatif bas (qui peuvent être utiles, par exemple, 
pour une première compréhension des caractéristiques générales d’un morceau), que 

7. Ces deux théories phonologiques — qui se sont développées dans le cadre générativiste pour 
rendre compte, respectivement, de certaines caractéristiques des langues à tons et de l’interaction 
texte- rythme-intonation — ont été employées pour la première fois pour l’étude des correspondances 
texte-mélodie dans des répertoires de chants par Chen (1981) (cf. aussi Chen 1984, Halle & Lerdahl 
1993, Hayes & Kaun 1996). Pour le traitement computationnel de ces deux théories, voir, entre 
autres, Hertz (1990) et Albro (1994). 
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des schémas plus détaillés qui quantifient, par exemple, les hauteurs en Hz ou en 
cent, ou bien qui fournissent des mesures exactes des durées. De plus, étant donné 
la capacité de itT d’effectuer des transformations, il est également possible de ne 
stocker dans l’ordinateur qu’un seul type de représentation relativement détaillée 
— c’est-à-dire l’analogue d’une édition verbale ‘standard’ (Grazioli 1996a, 1996b) — 
et de laisser ensuite à l’application la tâche de la transfomer en une représentation 
différenciée. Etant donné, par exemple, une représentation sous-jacente où les hau- 
teurs sont exprimées en Hz ou en cent, itT est en mesure, à partir aussi des choix 
faits par l’utilisateur, de dériver des visualisations ordinaires (c’est-à-dire effectuées 
en utilisant les conventions de transcription propres à la musique occidentelle), des 
visualisations ordinaires accompagnées de différents signes diacritiques (voir entre 
autres Macchiarella 1989), des représentations numériques (voir entre autres Ma- 
grini & Bellosi 1982, Macchiarella 1989) ou encore d’autres types de visualisation 
appropriés au contexte d’usage (une analyse musicologique, par exemple, une pu- 
blication scientifique, une publication didactique, etc.). 

Deuxièmement, cette organisation abstraite permet à l’utilisateur de créer des 
représentations ad hoc, ce qui peut être très utile dans de très nombreuses situations 
liées à l’étude des performances orales. 

Un exemple facile à comprendre est celui des chants utilisés pour coordonner le 
travail. En ce qui concerne ces chants, itT permet d’ajouter, dans la représentation 
sous-jacente, des colonnes qui représentent les phases du travail co-occurrentes avec 
les différentes composantes musicales. On peut citer comme exemple les chants des 
‘battipali’, c’est-à-dire des ouvriers vénitiens qui, jusqu’à récemment (mais la tra- 
dition remonte au moins au XVII siècle), enfonçaient les pilotis sur le fond de la 
lagune en faisant soulever et descendre un maillet (voir Pianta 1972, Leydi 1973). 
En l’absence d’informations concernant le mouvement du maillet vers le haut ou 
vers le bas, il est impossible de comprendre la structure de ces chants, qui servaient 
à coordonner le travail d’équipe. Le bruit provoqué par la chute du maillet peut, 
bien sûr, être considéré comme appartenant ou non à la performance du chant ; 
mais il est toujours possible, dans la représentation sous-jacente de itT, d’ajouter 
n colonnes — à côté des colonnes relatives aux hauteurs, aux durées et au texte du 
chant, et en plus d’autres colonnes éventuelles concernant d’autres caractéristiques 
strictement musicales de la performance — relatifs à la position du maillet. L’infor- 
mation contenue dans ces colonnes — tout comme les autres informations contenues 
dans chacune des colonnes d’une représentation sous-jacente de itT — pourra être 
visualisée par des expédients graphiques arbitraires au cas où l’utilisateur la considé- 
rerait comme utile à ses fins ; dans le cas contraire elle pourra être tout simplement 
négligée. 

Nous avons voulu choisir un exemple simple, qui ne peut pas rendre compte des 
potentialités que les représentations sous-jacentes de itT peuvent offrir à l’utili- 
sateur. Il faut cependant souligner que, dans une représentation de itT, on peut 
stocker tout genre d’information discrète : le doigté d’un instrument à vent, par 
exemple, la description de représentations choreutiques, etc. Et il faut aussi souli- 
gner que ces informations peuvent être comparées, manipulées et recherchées (même 
de façon approximative) tout comme les informations proprement musicales, pourvu 
qu’elles soient stockées dans des représentations sous-jacentes qui remplissent les 
contraintes syntactiques du système. 
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4 Als-H et le repérage des informations : l’utilisa- 
tion d’une base de connaissance lexicale 

Même si Als-H réunit des documents de typologies différentes (photographies, 
films, modèles tridimensionnels, transcriptions musicales, etc.), le composant tex- 
tuel est quoiqu’il en soit extrêmement important. En effet, en plus d’être employé 
pour spécifier les attributs standard de chaque document (par ex. le lieu et la date 
de réalisation d’une interview, d’une photographie, etc.; cf. § 2), le composant 
textuel est évidemment incontournable pour les éditions des textes ainsi que pour 
les descriptions concernant des événements tels qu’un rite religieux, un carnaval, 
un boniment de foire, une activité particulière qui prévoit l’emploi de techniques 
spécifiques, etc. Le composant textuel résulte en outre important également dans 
la mesure où certains documents compris en Als-H — ou éventuellement de leurs 
parties — à la discrétion de ceux qui s’occupent de la saisie des données peuvent être 
associés à des annotations capables d’en expliquer les caractéristiques et les particu- 
larités. Je me réfère par exemple à des photographies, à des vidéos, à des segments 
de fichiers audio, etc. liés (cf. la notion de cluster ‘grappe’, § 2) à des annotations 
au caractère explicatif ou descriptif. D’où les manquements qu’assument, en vertu 
des informations contenues en Als-H, les modalités à travers lesquelles un utilisa- 
teur peut accéder aux données en utilisant une procédure standard de recherche de 
nature textuelle. 

Il suffit par exemple de prendre en considération le cas d’un utilisateur qui, 
étant intéressé à l’élevage bovin dans une zone géographique z particulière, saisisse 
en plus de l’indication de cette dernière comme clé de recherche le terme bovino 
‘bovin’ (automatiquement associé, sur demande, à d’autres formes telles que bovin+i 
‘bovins’, etc. en raison de la présence en Als-H comme en Inter Testo d’un analyseur 
morphologique). En utilisant cette procédure, l’utilisateur pourra récupérer dans le 
système tous les documents qui contiennent la clé de recherche saisie (par exemple 
le texte d’une interview). En outre, celui-ci pourra récupérer également tous les 
documents (une photographie, un extrait d’un film, un fichier audio ou autre) qui 
contiennent la même clé de recherche dans les annotations. 

En utilisant cette simple procédure, l’utilisateur n’aura toutefois pas la possi- 
bilité d’accéder à des informations éventuellement présentes dans Als-H qui pour- 
raient avoir un rapport plus ou moins étroit avec le sujet de recherche qui constitue 
son objectif réel. Je fais allusion à des éditions ou à des annotations qui concernent 
des photographies, des dessins, des extraits de film, etc. où, au lieu de l’expression 
bovino ‘bovin’, on observe la présence de termes comme vacca ‘vache’, manzo ‘bou- 
vet’, vitello ‘veau’ ou mandria ‘troupeau’, ou encore de termes comme mammella 
‘mamelle’, garrese ‘garrot’, garretto ‘jarret’, etc. En outre, en saisissant comme clé 
de recherche le terme bovino ‘bovin’, l’utilisateur n’aura même pas moyen d’ac- 
céder à d’autres documents qui utilisent des expressions telles que stalla ‘étable’, 
mangiatoia ‘mangeoire’, mungitrice ‘trayeuse’, etc. 

D’où le choix d’englober en Als-H une base de connaissance lexicale qui per- 
mette à l’utilisateur d’opérer une c Query Expansion ’ (Voorhees 1994), ou bien de 
dériver, de manière interactive ou non, des termes synonymes ou associés conceptuel- 
lement à la clé de recherche saisie. Je me réfère à l’extension bilingue de WordNet 
— la base de connaissance lexicale la plus connue et la plus utilisée, mise au point 
pour la langue anglaise — développée auprès de IRST (‘Istituto di Ricerca Scientifica 
e Tecnologica’, Povo). 
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4.1 WordNet et l’extension italienne de IRST 

WordNet est une base de connaissance lexicale pour la langue anglaise déve- 
loppée à partir de 1985 auprès de l’université de Princeton (Miller et al. 1990, Miller 
& Fellbaum 1991, Miller 1995). 

En premier lieu, WordNet regroupe des mots anglais dans des ensembles de 
synonymes ( synsets ), dont chacun représente un concept lexical 8 . La correspon- 
dance entre formes lexicales et significations est maintenue à travers une matrice 
bidimensionnelle dans laquelle chaque synset est considéré comme un désignateur 
non ambigu de la signification d’un mot (voir fig. 13). 


Word 

Meanings 

Word Forms 

Fi F 2 F 3 ... F n 

Mi 

{Ei,i Ei î2 } 

m 2 

e 2 , 2 

m 3 

E 3 ,3 

M m 

E m,n 


FIGURE 13 - Matrice bidimensionnelle de WordNet. Dans la matrice, chaque entrée E 
(angl. entry) implique que la forme F (angl. word form ) dans une des colonnes peut être 
utilisée, dans un contexte approprié, pour exprimer une signification M (angl. word meaning) 
placé dans les lignes de la matrice. Donc, dans la figure, l’entrée Ei,i implique que la forme Fi 
pourra être utilisée pour exprimer la signification Mi. En cas de plusieurs entrées E à l’intérieur 
d’une des colonnes de la matrice, la forme correspondante F est polysémique. Au contraire, 
en cas de plusieurs entrées E à l’intérieur d’une des lignes de la matrice (ex. {Ei,i, Ei > 2 }), les 
formes correspondantes sont synonymes en rapport avec un contexte. 


En deuxième lieu, WordNet — en plus de rendre disponibles de brèves défi- 
nitions ou des contextes d’utilisation des mots compris dans celui-ci (à savoir des 
c glosses ’) — enregistre des relations sémantiques entre les divers synsets ou entre 
leurs membres, en faisant par ailleurs usage de l’héritage à l’instar des bases de 
connaissance normales. Pour les noms, par exemple, les relations sémantiques pré- 
vues par WordNet sont les suivantes : 


HYPERONYMIE : 

HYPONYMIE : 

COORDINATION : 


MÉRONYMIE : 

HOLONYMIE : 


A est un hyperonyme de B si chaque B est un (type de) A - 
ex. ‘équidé’ est un hyperonyme de ‘chevaux’. 

A est un hyponyme de B si chaque A est un (type de) B - ex. 
‘chevaux’ est un hyponyme de ‘équidé’. 

A est un terme coordonné de R si A et R partagent un hyper- 
onyme - ex. ‘chevaux’ est un terme coordonné de ‘mule’, et 
‘mule’ est un terme coordonné de ‘chevaux’ dans la mesure où 
aussi bien ‘chevaux’ que ‘mule’ partagent l’hyperonyme ‘équi- 
dé’. 

A est un méronyme de R si A est une partie de B - ex. ‘cadre’ 
est un méronyme de ‘fenêtre’. 

A est un holonyme de B si B est une partie de A - ex. ‘fenêtre’ 
est un holonyme de ‘cadre’. 


Au moment de passer à la version bilingue de WordNet mise au point par IRST 
(Magnini & Strapparava : à paraître, Magnini et al. 1994a, Magnini et al. 1994b) il 
convient de souligner à quel point cette version se base sur l’hypothèse qu’une grande 
partie des relations sémantiques initialement définies pour l’anglais par WordNet 
peuvent être partagées par une bonne partie des langues indo-européennes (cf. Ma- 
gnini & Strapparava : a paraître). Cette version vise par conséquent la réalisation 

8. La version courante de WordNet inclut environ 100.000 éléments lexicaux (noms, verbes, 
adjectifs, adverbes) organisées en 80.000 synsets environ. 
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d’une matrice lexicale non pas en deux (cf. fig. 13), mais en trois dimensions, où 
la dimension ajoutée est relative à n langues outre l’anglais. Actuellement, la seule 
langue outre l’anglais prise en considération par IRST est l’italien. 

La fig. 14, qui reprend les mêmes conventions que la fig. 13, montre les trois 
dimensions de la matrice lexicale multi-langue mise en œuvre auprès de IRST : 
les mots d’une langue, les significations et les langues prises en considération. Les 
lettres supérieures E et I indiquent respectivement ‘English’ et Ttalian’. 


Words 



FIGURE 14 - Matrice lexicale pour n langues parmi lesquelles la langue italienne (Magnini & 
Strapparava : a paraître). 

Afin de développer une matrice analogue à celle qui est représenté dans la figure 
fig. 14, il est nécessaire pour l’italien de reclasser les formes lexicales italiennes avec 
les significations correspondantes, en construisant de ce fait l’ensemble des synsets 
pour l’italien. En ce qui concerne au contraire les relations sémantiques on tente 
dans la mesure du possible de maintenir les relations définies par la version originale 
de WordNet (cf. Magnini et al. 1994a, Magnini & Strapparava : a paraître). 

4.2 L’emploi en Als-H 

Actuellement, et de manière complètement expérimentale, Als-H englobe une 
version élargie de la base de connaissance lexicale bilingue mise au point par IRST. 

Par rapport à cette dernière — en laissant de côté divers aspects de la mise en 
œuvre (par ex. les droits d’écriture, dont certains appartiennent en exclusivité aux 
responsables des archives, ou encore la sélection sur des bases contextuelles d’un 
synset spécifique pour un mot polysémique, cf. Grazioli 1996d) — la version utilisée 
en Als-H prévoit essentiellement deux différences : 

a. La présence d’un champ qui identifie — aussi bien dans la portion italienne 
que dans la portion anglaise de la base de connaissance lexicale — les termes 
identifiés comme ‘mots clés’ (angl. keywords , tags ) par rapport aux matériels 
typiquement de pertinence de AESS. L’ensemble de ces termes peut bien 
évidemment être élargi en fonction du matériel qui est au fur et à mesure 
saisi en Als-H 9 . 

9. On peut incidemment noter comment, étant donnée la spécialisation terminologique par- 
fois demandée dans le domaine ethnographique, certains termes peuvent résulter absents dans 
la portion italienne de WordNet mise au point par IRST, ou peuvent également ne pas avoir 
de correspondant dans la version exclusivement anglaise de WordNet. La saisie de ces termes, 
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b. L’adjonction dans la dimension L de la matrice présentée dans la fig. 14 de 
n dialectes afin d’englober dans la base de connaissance d’éventuels termes 
dialectaux présents dans des transcriptions, des glossaires, des annotations 
relatives à des photos ou des dessins, etc. (ex. bd — cf. Bassi & Milanesi 
1976 : 49 — pour l’italien bue , ‘bœuf’). 

Opérationnellement, ceux qui s’occupent de la saisie des données peuvent asso- 
cier un ou plusieurs mots clés à n’importe quel objet (ou à une partie de celui-ci ; ex. 
une donnée fragmentée d’un fichier audio ou vidéo ou bien d’une photographie : cf. 
par example fig. 7) présente en Als-H. On peut par conséquent avoir des associa- 
tions de mots clés avec des objets tels que des éditions textuelles ou musicales, des 
liens, du matériel audio et vidéo, des modèles tridimensionnels, etc. En conséquence, 
ces objets peuvent résulter implicitement reliés l’un à l’autre en termes purement 
conceptuels, dans la mesure où les mots clés qui leur sont associés résultent alignés 
aux synsets et aux relations sémantiques présentes dans la base de connaissance 
dont se sert Als-H. 

Conformément à une recherche d’informations de la part d’un utilisateur, l’utilité 
de l’intégration en Als-H d’une base de connaissance lexicale est évidente. 

Il convient en effet de revenir à l’exemple brièvement décrit précédemment d’un 
utilisateur intéressé à l’élevage bovin dans une zone géographique donnée. En sé- 
lectionnant l’activation au cours de la recherche de la base de connaissance lexi- 
cale, et en saisissant la clé de recherche bovino ‘bovin’ en plus de l’indication de la 
zone géographique 10 , l’utilisateur sera en mesure d’obtenir des informations asso- 
ciées seulement conceptuellement — en raison des relations définies par la base de 
connaissance — à la clé de recherche saisie (voir fig. 15). 

Actuellement, l’obtention d’un ensemble de termes analogue à celui fourni par la 
clé de recherche ‘étendue’ de la fig. 15 peut s’effectuer par le biais de deux modalités 
différentes : 

a) en se servant de la sélection de nœuds graphiques spécifiques montrés sur 
vidéo et générés par l’interaction de la clé de recherche saisie avec i) la 
base de connaissance lexicale, ii) les algorithmes qui interviennent sur les 
L glosses ’ et avec iii) les paramétrisations (ex. la typologie des objets recher- 
chés : transcriptions, fichier audio ou vidéo, etc.) spécifiées par l’utilisateur ; 
il est possible de visualiser les graphiques dans des environnements Unix par 
1’ ‘Information Landscape’ (‘Paysage Informatif’ ; voir fig. 9 et fig. 10) et, dans 
d’autres systèmes d’exploitation (ex. Microsoft Windows, Apple Mac OS), 
par itG (voir fig. 11) ou par des applet Java qui montrent des ‘Hyperbolic 
Tree Browsers’ (Lamping et al. 1995) ; 

b) en choisissant d’extraire la liste complète des résultats, constituée i) par 
les termes qui ont des relations immédiates ou des chaînes de relations (la 
profondeur de ces dernières peut être définie par l’utilisateur) avec la clé de 
recherche saisie ; ii) par le résultat des algorithmes réalisés pour extraire des 
‘ glosses ’ des termes identifiés comme étant pertinents par rapport à la clé de 
recherche saisie ; iii) par d’éventuelles paramétrisations spécifiques définies 
par l’utilisateur. 

Il convient encore d’observer comment il est possible d’effectuer une recherche 
analogue à celle illustrée dans la fig. 15 en utilisant également la langue anglaise 
(c’est à dire en bénéficiant directement des données contenues dans la version origi- 
nale de WordNet, à laquelle les données italiennes englobées par IRST résultent 

ainsi que les opérations que cette saisie peut entraîner, sont réservées aux seuls responsables des 
archives. 

10. Les zones géographiques de relevé des données font partie des attributs standard assignés 
à chacun des objets saisis en Als-H, et peuvent donc être sélectionnés à travers une normale 
procédure de recherche (cf. § 2). 
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Exemple de Query Expansion 

• bovino ‘bovin’ ; [...] ; • bôs (lat.) ; •torello 
‘taurillon’ ; • vitello , vitellone ‘veau’ ; 

• giovenca , vitella ‘génisse’ ; •giovenco 
‘bouvillon’; • bd (dial.), bove , bue ‘bœuf’; 
•manzo ‘bouvet’ ; •toro ‘taureau’ ; 

• mucca , vacca ‘vache’ ; •latte ‘lait’ ; 
•latticini ‘produits laitiers’; •burro 
‘beuerre’ ; •cagliata ‘caillé’; •formaggio 
‘fromage’; •bovini_da_macello ‘bovins 
de boucherie’, ‘bovins d’abbattoir’ ; 
•bestiame ‘bétail’ ; •ruminante 
‘ruminant’ ; • armento , branco , mandria 
‘troupeau’ ; • livrea , mantello ‘pelage’ ; 
•mammella ‘mamelle’ ; •garrese ‘garrot’ ; 
•garretto ‘jarret’ ; •coda ‘queue’ ; •muso 
‘museau’ ; •stalla ‘étable’ ; • mangiatoia , 
greppia ‘mangeoire’ ; •fienile ‘fenil’ ; 
•mungitrice ‘trayeuse’ ; •mammifero 
‘mammifère’; •animale ‘animal’; [...] 


FIGURE 15 - Illustration extrêmement schématique du mécanisme de recherche en Als-H 
au cas où l’utilisateur activerait l’emploi de la base de connaissance lexicale englobée dans le 
système. Il convient de noter comment les relations — à l’instar des algorithmes qui agit sur les 
‘ glosses ' — peuvent également être activées isolément (ex. coordination + hyponymie) en 
spécifiant éventuellement l’activation du mécanisme d’héritage des informations qui caractérise 
en temps normal une base de connaissance. L’utilisateur peut aussi sélectionner l’activation de 
l’analyseur morphologique pour la clé de recherche saisie comme pour les éléments de la clé 
de recherche dérivée à travers une opération de Query Expansion. En outre, l’utilisateur peut 
activer un ou plusieurs des n dialectes présents dans la dimension L de la base de connaissance 
lexicale de Als-H, décider de quelles typologies d’objets la recherche doit tenir compte (ex. 
éditions, fichier audio, etc.) et élargir éventuellement la recherche en laissant de côté l’utilisation 
des seuls mots clés. En utilisant cette dernière solution, la recherche peut s’effectuer à travers 
une utilisation paramétrée de toute la base de connaissance lexicale dont le système dispose. 


étroitement alignées) et à l’avenir également à travers d’autres langues pour les- 
quelles divers centres de recherche utilisent actuellement des matrices analogues à 
celle de la fig. 15 pour enrichir la dimension L (Emanuele Pianta, communication 
personnelle; pour la construction d’un ‘EuropeanWordNet’ voir Vossen 1996). Cela 
offre des avantages évidents conformément à la recherche en ligne en Als-H de la 
part d’utilisateurs qui, quoiqu’ intéressés par les documents stockés dans le système, 
n’ont pas une maîtrise suffisante de la langue italienne. 

Il convient enfin d’observer comment — par le biais d’Internet — Als-H, sa base 
de connaissance lexicale et l’ensemble des termes identifiés comme des ‘mots clés’ 
peuvent aussi être utilisés par des réalités (archives locales, musées ethnographiques, 
etc.) autres que AESS, mais qui décident de toute manière d’en partager les critères 
d’archivage et de catalogage. 

5 Conclusions 

Dans l’introduction nous avons signalé deux des problèmes qui caractérisent 
typiquement les archives informatisées relatives à des matériaux ethnographiques : 
l’absence de connexions parmi des données variées qui peuvent même concerner une 
recherche singulière sur le terrain, et l’absence de dispositifs orientés vers l’analyse, 
la comparaison et la recherche des données. 

En ce qui concerne le premier problème, dans cet article nous avons vu que 
ALS-H, en exploitant les potentialités de Hyper- G /Hyper Wave, peut gérer de façon 
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très sophistiquée les relations les plus variées existant à l’intérieur d’un événement 
singulier ou bien parmi des événements différents mais sous certains aspects reliés. 

En ce qui concerne le deuxième problème, dans cet article nous nous sommes 
limités à fournir des exemples concernant une partie des dispositifs que ALS-H 
met actuellement [décembre 1996] à la disposition des utilisateurs. Ces dispositifs 
fournissent des avantages considérables pour les utilisateurs qui ne considèrent pas 
les archives uniquement comme une masse de données, mais qui demandent aussi 
des moyens pour utiliser ces données dans le cadre d’hypothèses de travail concrètes. 
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